查看原文
其他

专家点评Nat Genet | 李蔚团队报道多聚腺苷酸化(APA)关联遗传位点可以解释人类复杂疾病

BioArt BioArt 2022-04-27
点评 | 杨剑(西湖大学)

责编 | 兮


全基因组关联分析发现大量与人类复杂疾病关联的风险位点,然而这些位点有将近90%以上都位于非编码区域,给分子层面解释这些变异位点带来很大挑战。分子表型数量性状位点(molecular quantitative trait locus)是关联基因型到疾病表型最重要的中间途径。其中,表达数量性状位点(eQTL)及可变剪接数量性状位点(sQTL)等尽管已被用以解释部分疾病关联的非编码区遗传变异位点,但仍有很大一部分与疾病相关的非编码变异位点无法被解释。


选择性多聚腺苷酸化 (alternative polyadenylation, APA) 是一种重要且广泛存在的基因转录后调控过程,大多数APA都发生在3'UTR区域。APA可以影响mRNA的稳定性,翻译效率,和蛋白的细胞定位等重要过程。APA的异常调控通常与疾病的发生和发展密切相关。美国贝勒医学院终身教授, 加州大学(尔湾)讲席教授李蔚教授实验室近年来专注APA领域,并且在过去几年里做出了一系列原创性的发现。李蔚团队开发了第一个从传统RNA-seq数据里直接分析APA的生物信息算法DaPars (Nature Communications 2014),发现了CFIm25蛋白可以通过影响APA来控制脑瘤的生长(Nature 2014),报道了APA可以通过竞争性内源RNA (ceRNA) 的机理来控制抑癌基因的表达 (Nature Genetics 2018),阐明了一类肿瘤特异性泛素连接酶MAGE-A11是癌症中APA的主要调控因子(详见BioArt报道:Molecular Cell | 李磊博士等揭示肿瘤选择性多聚腺苷酸化的新机制)(Molecular Cell 2020)。该研究解决了领域里面一个多年悬而未决的问题,为什么在肿瘤中广泛存在3'UTR缩短,并为转录后调控对肿瘤的发生和调控机制提供了新的见解。


2021年5月13日,美国加州大学(尔湾)分校李蔚教授课题组李磊博士(现深圳湾实验室特聘研究员)与合作者在Nature Genetics上发表题为 An atlas of alternative polyadenylation quantitative trait loci contributing to complex trait and disease heritability 的研究长文。该项研究提出了位于基因的3′非翻译区(3′UTR)的选择性多聚腺苷酸化(APA)的遗传变异(3′aQTL)可用来解读新的疾病风险易感位点的理论, 同时发现3′aQTL可以解释大约16.1%的人类复杂疾病和性状差异。该项研究对遗传变异,分子机理与复杂疾病的关联进行了系统分析,为揭示人类复杂性状和疾病病因学提供了新的见解。



该项工作首先改进了一种可直接从标准转录组数据中来检测并定量分析APA的算法DaPars v2。该方法既克服了传统3′末端测序方法应用的局限性,又改进了之前的计算方法只能两两比对等缺点。利用这个新的算法,李磊博士全面分析了基因型-组织表达项目(Genotype-Tissue Expression,GTEx)中的8277个公共的RNA-seq和基因组数据,发现了大约40万个与APA相关的遗传变异位点并命名为APA数量性状位点(3'aQTL),使3'aQTL的数量比之前报道的APA相关的位点增加了几个数量级。这些3'aQTL关联的基因共有11613个, 占已注释基因的51%,通过遗传力估计分析还发现3'aQTL能解释大约25.2%的APA变异和16.2%的基因表达变异。另外,作者首次构建了人类多组织APA遗传图谱并分析了3'aQTL在各个组织的分布情况。通过多元自适应收缩分析(MASH)发现相对于eQTL, 3'aQTL有更强的组织特异性。


为了进一步研究3′aQTL与其他传统mQTLs的区别和联系,作者比较分析了这些分子特征结果表明,不同于eQTL和sQTL主要富集于基因启动子/上游区和剪接区,3′aQTL则显著富集于3′UTR或位于基因下游5kb以内。另外3′aQTL相关的基因也比eQTL相关的基因的3’UTR区域更长,有更显著的调控区域。为了探究其导致APA现象的潜在机制,作者进一步系统分析了3′aQTL与poly(A) 基序(motif),RNA 二级结构和 RNA 结合蛋白(RBP)结合位点的关联,发现3′aQTL可以通过改变这些元件进而影响数与千计的APA现象。有意思的是,在对ENCODE组织的RNA 结合蛋白分析了发现一个APA全新的调控因子LARP4,大约30%的3′aQTL可以通过改变LARP4的结合位点来调节下游基因的APA。这为APA关联的遗传位点提供了一种全新分子调控机制, 同时也为之后发现APA调控因子提供了一个新的角度。


最后,作者还分析了3′aQTL与疾病的关系。通过对23种常见人类疾病和性状与3′aQTL之间是否存在富集性统计分析,发现3′aQTL富集在11.5%的组织/性状中,而eQTL则富集在26.5%的组织/性状中。有意思的是,这其中有9.8%的疾病性状只存在3′aQTL的富集,这其中包括阿茲海默症和类风湿性关节炎. 其次通过共定位分析,发现3′aQTL与大约16.1%的疾病性状相关变异是共定位的,并且与其他QTL(如eQTL, sQTL)有很大的不同, 这揭示这些大多数这些疾病关联的3′aQTL都不直接调控基因表达,可能参与调控mRNA的稳定性,翻译或细胞定位。


该项工作对解释人类复杂疾病风险易感位点有着重要的推动作用,为揭示人类复杂性状和疾病病因学提供了新的方向。


李蔚课题组诚招生物信息博士后,研究方向为APA以及表观遗传的大规模数据挖掘来解释人类复杂疾病,例如癌症,老年痴呆,糖尿病等。李蔚教授已经发表了190篇文章,其中有23篇通讯作者文章在Nature, Cell and Science系列杂志发表。李蔚教授过去的学生已经有6位在美国一流研究型大学(包含哈佛医学院,匹兹堡大学和梅奥诊所)获得了独立PI的教授职位,有2位学生获得了中国国家QNQR头衔。实验室详情参见:https://sites.uci.edu/weililab/。


深圳湾实验室特聘研究员李磊课题组诚招助研,博士后,科研助理。主要从事RNA系统生物学,基因组学高通量数据的整合和挖掘分析,人类复杂疾病和性状的机理探究。目前共发表论文30余篇,累计影响因子>230,其中7篇发表在在Nature,Cell子刊杂志系列。在过去5年中,论文共被他引近1000次,H-index=17。多篇文章被Nature Reviews Cancer, Molecular Cell, F1000, BioArt等撰文推荐或封面报道并申请专利一项。目前担任Molecular Psychiatry,Nucleic Acids Research等期刊的审稿人。实验室详情参见:http://bioinfo.szbl.ac.cn/。


专家点评

杨剑 西湖大学教授


发现和解读人类基因组遗传变异与复杂疾病的关联,是理解疾病遗传机理、寻找疾病诊断和治疗靶点的重要基础。全基因组关联研究(GWAS)是鉴定与复杂性状关联遗传变异的有效研究方法。目前,GWAS已经发现了超过5万个与人类复杂性状(包括疾病)关联的遗传变异 (GWAS catalog: https://www.ebi.ac.uk/gwas/),极大地促进了我们对复杂疾病遗传特征的理解以及疾病诊断标记和治疗靶点的发现。然而,绝大多数的遗传风险位点位于非编码区,其分子机制难以被解释。因此,开发新的方法和研究策略用于解读非编码遗传变异与疾病关联的分子机制仍面临巨大挑战。


人类基因组计划完成之初,非编码DNA被当作基因组的“暗物质”,对其功能知之甚少。随着研究方法的不断创新,对基因组研究的不断深入,我们对非编码DNA的认识不断加深。大量研究发现非编码DNA存在大量的功能调控元件,能够通过调控目标基因的转录(transcription)、剪接(splicing)和多聚腺苷酸化(polyadenylation)等过程来影响生命过程。近年来,通过分子数量性状位点(molecular quantitative trait locus,简称xQTL)研究,包括表达数量性状位点(eQTL)和剪切数量性状位点(sQTL)等,能够有效地鉴定影响基因表达和可变剪接的非编码区DNA变异位点,从而促进了对部分非编码区遗传风险位点的分子机制的解释。然而,这些被解释的只是冰山一角,仍有大量的非编码遗传风险位点无法被eQTL和sQTL等机制解释。


面对这些问题和挑战,李磊博士等首次提出了以选择性多聚腺苷酸化(alternative polyadenylation, APA)作为分子表型的APA数量性状位点(3’aQTL),为解读非编码区遗传变异提供了新的方法。


这项突破性工作,极大地推动了该领域的发展。具体体现在以下几个方面:1)开创性地提出3’aQTL概念及分析方法,为功能性非编码变异的识别和解读提供了全新的方法;2)这项工作中全面系统地分析了GTEx项目中46个组织467个个体的转录组数据,展示了人类多组织、个体间APA遗传变异的定量图谱;3)从分子机理层面发现3′aQTL与其他传统的分子数量性状显著不同,且其可以改变poly(A)基序(motif)、RNA二级结构和RNA结合蛋白(RNA binding protein, RBP)的结合位点,进而导致成千上万的APA改变。另外通过对公共调控数据的挖掘发现一个全新的APA调控因子LARP4;4)3’aQTL能解释大约16%的复杂性状关联的风险位点。


原文链接:

https://doi.org/10.1038/s41588-021-00864-5


制版人:十一

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存